#!/usr/bin/env python
# encoding: utf-8

import os
import re

basedir = os.path.abspath(os.path.dirname(__file__))

# PhraseDiscovery内存缓存文件,第一次从dict加载后生成该文件，后续可以直接读取该缓存文件
model_dump_file = basedir + "/data/discovery.pkl"

# 通用词频文件
dict_file = basedir + '/data/dict.txt'

# 分词停止字符字典文件
stop_word_file = basedir + '/data/stopword.txt'

sentence_split_pattern = re.compile(r'(。|！|\!|\.|？|\?|，|,)')